PowerScale |瞭解 L3 快取與中繼資料原則

摘要: PowerScale 可讓您靈活運用節點集區內的固態硬碟 (SSD) 來增強效能。兩種主要策略是 L3 快取和元數據加速。L3 快取記憶體旨在快取經常存取的資料和中繼資料,以改善讀取效能。元數據加速專用於 SSD 用於存儲和加速元數據操作,這對於元數據密集型工作負載非常有用。

本文章適用於 本文章不適用於 本文無關於任何特定產品。 本文未識別所有產品版本。

說明

瞭解 L3 快取記憶體:

L3 快取記憶體:L3 快取記憶體是位於 SSD 上的次要快取等級,可補充主要記憶體快取 (L1 和 L2)。它充當逐出緩存,存儲經常訪問的數據和元數據以改善讀取延遲。L3 快取對於涉及隨機檔訪問的工作流最有用。它可以在歸檔系列存儲節點的僅元數據模式下運行。在 SSD 上包含現有資料的節點集區啟用 L3 快取時,需要磁碟機先將資料撤出至 HDD,然後才能將 SSD 用於快取。停用 L3 快取通常操作較為快速。

受益於 L3 快取的工作流: 

    • L3 快取有利於具有以下特徵的工作流:
    • 隨機檔案存取:若工作負載需要頻繁讀取檔案的不同、非循序部分,則 L3 快取會大幅降低延遲。
    • 高讀寫率:由於 L3 快取主要加速讀取,因此具有主要讀取元件的工作流程受益最大。
    • 經常存取的「熱」資料的快取:L3 快取會自動識別和儲存經常存取的資料,提升重複存取的效能。
    • 流式處理和並行檔案存取 (在一定程度上):雖然隨機訪問的優勢最大,但具有流式處理和併發訪問的工作流也可以通過 L3 緩存獲得一些性能改進。

何時選擇 L3 快取記憶體:

    • 當主要性能瓶頸是數據和元數據的隨機讀取延遲時。
    • 擴展節點的有效記憶體容量,而不會產生更多 RAM 的成本。
    • 適用於最近從 L2 逐出大量重新讀取資料和中繼資料的工作負載。
    • 對於歸檔類節點,檔案系統遍曆的元數據性能至關重要。
    • 當需要更簡單的「一勞永逸」讀取效能增強功能,同時又不會造成顯著的組態額外負荷時。
      何時選擇中繼資料加速:
    • 當元數據操作(查找、訪問、修改)是主要性能瓶頸時。
    • 適用於具有大量中繼資料讀取 (中繼資料讀取加速) 或同時讀取和寫入 (中繼資料讀/寫加速) 的工作負載。
    • 在地震解釋等場景中,即使基礎數據駐留在較慢的存儲上,快速元數據訪問也至關重要。
    • 當需要對元數據的駐留位置進行精細控制時。
    • 當將中繼資料讀取優勢延伸至沒有本機 SSD 的節點時 (在其他節點上使用 GNA 和中繼資料讀取加速)。
    • 主目錄、檔案列舉繁重的工作流程,以及需要大量比較的活動等工作負載,通常都會呈現較高的中繼資料讀取活動。在這種情況下,直接加速元數據訪問可以顯著提高性能

瞭解中繼資料策略:

中繼資料策略:SSD 可配置為主要存儲和加速元數據操作,而不是緩存數據。此策略對於具有大量元數據訪問的工作負載(例如許多小檔、頻繁的目錄查找和元數據密集型作業引擎任務)非常有用。OneFS 支援不同的中繼資料 SSD 策略,包括中繼資料讀取和中繼資料寫入。

中繼資料讀取:固態硬碟主要用於加速中繼資料讀取作業。

中繼資料寫入:固態硬碟用於加速中繼資料寫入作業。 

  • 中繼資料策略相對於 L3 快取的優點:
  • 元數據加速 對於如何使用 SSD 以提高特定數據集和工作流的元數據性能提供了更有針對性的精細控制。另一方面,L3 緩存是一個更通用的緩存層,有利於更廣泛的工作負載,尤其是那些對數據和元數據具有重複隨機讀取訪問許可權的工作負載。雖然 L3 快取在提高經常存取資料的讀取效能方面表現出色,但專用中繼資料策略可提供特定的優勢: 
    • 改善中繼資料效能:對於中繼資料操作為瓶頸的工作負載 (例如開啟、關閉、重新命名、列出大量檔案),將固態硬碟專用於中繼資料可大幅減少延遲並改善整體輸送量。
    • 增強 Job Engine 效能:特定 OneFS 作業引擎工作會處理中繼資料密集型工作。加快元數據訪問可以縮短這些作業的完成時間。
    • 為元數據密集型工作負載提供可預測的性能:在具有一致的高元數據活動模式的環境中,與基於逐出的緩存相比,專用元數據策略可以提供更可預測和持續的性能改進。
    • 與實際的數據讀取和寫入相比,某些應用程式和工作流生成的元數據操作數量高得多。示例包括檔歸檔、媒體資產管理、電子設計自動化 (EDA)、頻繁編譯的軟體開發環境以及涉及大量小檔訪問和分析的基因組學管道。在這些情況下,與訪問和操作元數據相關的延遲可能會成為嚴重的性能瓶頸
    • 涉及導航複雜目錄結構 或列出許多目錄內容的操作嚴重依賴於元數據性能。元數據加速可確保系統能夠快速訪問 inode 資訊和目錄條目,與依賴可能由於容量限制或訪問頻率降低而逐出此資訊的 L3 緩存相比,顯著加快這些操作的速度
    • 備份複製遷移:這些數據管理任務通常涉及大量的元數據掃描和處理。透過加速加速加快中繼資料存取速度,可大幅減少完成這些工作所需的時間、將主要工作負載中斷的情況降至最低,並提升營運效率。
    • 搜尋與索引:當使用者或自動化流程必須根據元數據屬性(例如,名稱、大小、修改日期)搜索特定檔時,加速元數據訪問可實現更快的查詢執行。這與 MetadataIQ 等解決方案相關,它會為檔案系統元數據編製索引,以便在多個集群中實現高效的查詢和數據發現
  • 何時選擇中繼資料: 
    • 繁重的目錄流覽、檔案或數據搜索操作、索引。
    • 檔案作業,例如開啟、關閉、刪除、建立目錄 (mkdir)。
    • 查閱、取得和存取等作業。
    • 主目錄,尤其是具有許多物件的目錄。
    • 涉及大量枚舉或比較的工作流。
    • 地震數據解釋,其中元數據及時性至關重要。
    • 元數據加速可以為這些類型的活動帶來顯著的性能改進,從而提高輸送量並減少延遲

摘要:何時選擇

    • 如果工作負載嚴重偏向於訪問或修改檔元數據的操作(流覽、搜索、索引、創建、刪除、修改屬性),請選擇元數據加速策略(元數據讀取或元數據讀/寫)。
    • 如果您的工作負載主要是元數據讀取密集型工作負載,並且您希望使用較少的 SSD 容量,請選擇元數據讀取加速
    • 如果您的工作負載涉及大量中繼資料寫入、需要更快的快照刪除速度,或是像 EDA 這樣的小型檔案因快閃記憶體上的內嵌小型檔案而受益,請選擇中繼資料讀取/寫入加速。請確定您有足夠的 SSD 容量。
    • 如果您有混合集群(帶和不帶 SSD 的節點),並且必須加速駐留在集群中非 SSD 節點上的數據的元數據讀取,請考慮使用 GNA。這與分散的元數據密集型工作負載相關。
      • 全域命名空間加速 (GNA):GNA 是一種較舊的機制(旨在在所有節點都有 SSD 時替換為 L3 快取),它允許沒有 SSD 的節點池通過在這些 SSD 上存儲額外的元數據鏡像來利用群集中其他位置的 SSD。這可加速儲存在僅 HDD 集區上的資料的中繼資料讀取作業。L3 快取和 GNA 可以共存在同一群集中,但通常在不同的節點池上運行。
    • 如果您的工作負載涉及大量隨機讀取、受益於大型工作集的擴展緩存,或者需要改進 Job Engine 性能(前提是您的節點具有 SSD),請考慮使用三級緩存

工具和命令:

  • 效能監控:使用 InsightIQ、CloudIQ 及 MetadataIQ 等工具來監控叢集執行狀況、效能指標和用量預測。InsightIQ 可追蹤效能趨勢、識別模式,並執行檔案分析。它還可以幫助估計集群何時達到最大容量。CloudIQ 提供叢集效能的深入解析。MetadataIQ 有助於跨集群進行數據索引和查詢,可用於數據生命週期管理和了解數據分佈。
  • isi_cache_stats 公用程式可協助判斷工作資料集大小,這與調整 L2 和 L3 快取的 SSD 大小相關。一般規則建議 L2 容量 + L3 容量應 >= 工作集大小的 150%。
  • MetadataIQ (OneFS 9.10+):部署和設定 MetadataIQ,以索引並建立跨叢集的中繼資料全域目錄。使用 Kibana 儀表板可視化數據分佈、檔計數和元數據屬性。這有助於了解數據的組成以及元數據的增長方式。定期同步使元數據資料庫保持更新
  • InsightIQ 提供叢集容量報告,包括總容量、已佈建容量及已用容量,讓您根據歷史趨勢預測儲存需求。它可以監控工作負載性能、延遲、IOPS 和輸送量,使您能夠在數據增長時檢測潛在的瓶頸。InsightIQ 的檔案系統分析報告可以顯示檔案計數和大小分佈,讓您深入了解資料的規模和組成,這與 LIN 計數增長直接相關。

受影響的產品

Isilon, PowerScale, PowerScale OneFS
文章屬性
文章編號: 000321641
文章類型: How To
上次修改時間: 16 5月 2025
版本:  1
向其他 Dell 使用者尋求您問題的答案
支援服務
檢查您的裝置是否在支援服務的涵蓋範圍內。